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miR-34 基因 家 族 的 分 子 进化 


KEN, FEF, FEX 
(南昌 大 学 生命 科学 学 院 ， 江西 南昌 330031) 


摘要 : 根据 miRNA 基因 在 进化 中 高 度 保 守 的 特点 ， 利 用 生物 信息 学 方法 在 目前 已 测序 的 动物 物种 中 搜寻 参 
与 哺乳 动物 早期 发 育 调控 的 mir-34 基因 的 同 源 序列 ， 在 33 个 不 同 的 动物 物种 中 获得 了 miR-34 基因 的 54 条 同 源 
序列 ， 其 中 18 条 为 新 发 现 的 序列 。 表 明 miR-34 是 高 度 保守 的 ,广泛 存在 于 后 生动 物 中 。 目 前 发 现 的 mir-34 基 
因 80% 位 于 基因 间隔 区 ， 少 数位 于 蛋白 编码 基因 的 内 含 子 区 和 3'UTR 上 。 不 同 动物 中 ，mir-34 基因 成 熟 序列 的 
同 源 性 为 68% ， 前 体 序列 为 38.89%。 在 无 消 椎 动物 中 只 有 一 个 mir-34 ， 而 在 几乎 所 有 的 冰 椎 动物 中 都 有 mir- 
34a, mir-34b, mir-34c, FÈ miR-34 基因 家 族 。 系 统 进化 分 析 表 明 ， 次 椎 动物 中 miR-34 基因 家 族 是 通过 基因 
的 串联 和 局 部 重复 形成 的 ， 这 个 过 程 中 伴随 着 个 别 碱 基 的 变异 。 
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Molecular Evolution of miR-34 Gene Family 


GAO Jia-li, LUO Yu-ping* , LI Si-guang 
( College of Life Sciences, Nanchang University, Nanchang 330031, China ) 


Abstract: miR-34 gene can regulate early development of mammalian. Using bioinformatics analysis of sequenced 
metazoan genomes, 54 miR-34 genes of 33 different animal species were found. Eighteen miR-34 genes were identified in 
the first time, suggesting miRNA are highly conservative and widespread in Eukaryotes. Of these mir-34 gene homologues 
identified in metazoan, 80% locate in the intergenic region, the others are in the intron or 3'UTR of protein-coding gene. 
miR-34 gene is conserved in various animals, and the mature sequences and precursors of mir-34 gene in metazoan ana- 
lyzed share 68% and 38.89% sequence identity, respectively. However there is only a mir-34 gene in invertebrate and 
three mir-34 genes, mir-34a , mir-34b and mir-34c are present in almost all vertebrate . The phylogenetic analysis reveals 
that the miR-34 gene family of vertebrate originated from local and tandem duplications followed by mutation of individual 
base after divergence from invertebrate . 
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MicroRNA (miRNA ) 是 一 类 由 内 源 基因 编码 H miRNA 主要 是 通过 翻译 抑制 来 负 调控 丢 基 因 。 
的 长 度 约 为 22 个 核 苷 酸 的 非 编码 单 链 RNA 分 子 ， ”不 同 的 是 ,植物 miRNA 主要 是 引起 靶 基因 mRNA 
它们 在 动 植物 中 参与 转录 后 基因 表达 调控 。 第 一 个 ”的 降解 。 
miRNA 基 lin-4 是 Lee et al (1993) 在 研究 到 目前 为 止 ， 在 动 植物 以 及 病毒 中 已 经 发 现 有 
线虫 发 育 缺 陷 时 发 现 的 ， 它 通过 与 靶 基 因 Ha-14 ”4361 个 miRNA 分 子 (Release 9.0, October 2006 )。 
mRNA3'UTR 区 互补 配对 ， 从 而 抑制 Lin-14 蛋白质 。 大 多 数 miRNA 基因 以 单 拷贝 、 多 拷贝 或 基因 簇 
的 表达 。Reinhart et al (2000) ) 和 Pasquinelli et al (cluster ) 的 形式 存在 于 基因 组 中 ( Lagos-Quintana 
(2000) 又 在 线虫 中 发 现 了 第 二 个 有 异 时 性 开关 功 。 et al，2001; Lau et al，2001 )。 然 而 ， 最 近 的 研究 
能 的 let-7 RNA， 其 丢 基 因 控 制 着 线虫 从 LA 阶段 到 HAKA 70% 的 哺乳 动物 miRNA 基因 是 位 于 TUs 
成 虫 阶段 的 发 育 转变 。 正 像 lin-4 和 let-7 那样 ， 动 区 ( transcription units, TUs ) ( Rodriguez et al, 
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2004)， 且 其 中 大 部 分 是 位 于 内 含 子 区 (Kim & 
Nam, 2006) 一些 内 含 子 miRNA 基因 的 位 置 在 不 
同 的 物种 中 是 高 度 保守 的 ， 例 如 ，miR-7 在 哺乳 动 
物 和 昆虫 的 hnRNP K 蛋白 内 含 子 区 都 有 发 现 。 另 
外 一 个 很 有 趣 的 例子 是 ，miR-106b 基因 家 族 在 人 
类 和 老鼠 中 均 位 于 MCM 基因 的 第 13 个 内 含 子 上 
(Kim & Nam, 2006). miRNA 不 仅 在 基因 位 置 上 保 
守 ， 序 列 上 也 呈现 出 高 度 的 同 源 性 〈Pasquinelli et 
al, 2000; Ruvkun et al, 2001; Lee & Ambros, 
2001). ÆRE Caenorhaboditis elegans 中 所 发 现 的 
miRNA, 85% 都 可 以 在 C. briggsae 的 基因 组 中 找 
到 同 源 序列 ( Lau et al, 2001 )。 植 物 中 ，miR-39 的 
同 源 序列 在 拟 南 芥 、 水 稻 和 烟草 中 都 存在 〈Rein- 
hart et al, 2002; Llave et al, 2002 )。 

miRNA 高 度 的 保守 性 与 其 功能 的 重要 性 有 着 
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密切 的 关系 。Houbaviy et al (2003 ) 研究 发 现 ， 
miR-34 基因 在 小 鼠 胚 胎 干细胞 中 特异 性 表达 ， 它 
门 可 能 参与 维持 胚胎 细胞 的 全 能 性 以 及 哺乳 动物 的 




















早期 发 育 调控 。miRNA 与 其 靶 基 因 的 进化 有 着 密 
切 的 联系 ， 研 究 其 进化 历史 有 助 于 进一步 了 解 其 作 
机 制 和 功能 。 本 文 依据 miRNA 基因 在 物种 间 的 
保守 性 ， 利 用 生物 信息 学 同 源 性 搜寻 、 比 对 的 方法 
分 析 miR-34 基因 家 族 的 系统 进化 历史 。 


1 材料 和 方法 


1.1 数据 的 获得 

从 miRNA 数据 库 ( http: //microrna .sanger .ac .uk/ 
cgi-bin/sequences/browse.pl ) 中 获得 人 mir-34 基因 的 
前 体 序列 〈 has-mir-34a, has-mir-34b, has-mir-34e ) 
以 及 线虫 mir-34 基因 的 前 体 序列 C cel-mir-34 )。 
1.2 同 源 性 搜寻 

分 别 用 人 和 线虫 的 miR-34 基因 的 前 体 序列 通 
过 同 源 性 比 对 的 方法 在 所 有 动物 物种 中 进行 搜寻 。 
本 文 使 三 个 数据 库 ,分 别 是 NCBI 数据 库 
C http: //www.ncbi.nlm.nih.gov/blast ); ENSEMBL 
数据 库 ( http: //www . ensembl .org/index.html ) 以 
及 UCSC 数据 库 (http: //genome.ucsc .edu/cgi-bin/ 
hgBlat )。 在 前 两 者 中 是 通过 BlastN (Altschul et al, 
1990) 程序 进行 搜寻 ,在 UCSC 数据 库 中 是 通过 
BLAT (Kent, 2002) 程序 搜寻 。 
1.3 二 级 结构 预测 

利用 在 线 的 Mfold 程序 Chttp: //www.bioinfo. 
rpi .edu/applications/mfold/ma/form1 .cgi ) ( Zuker, 

























































































































































































2003) 对 所 有 搜寻 到 的 新 序列 进行 二 级 结构 的 预 
测 。 将 预测 结果 与 miRNA 的 鉴定 标准 ( Ambros et 
al, 2003) 作 比较 ， 成 熟 序列 长 度 应 约 为 22 核 背 
酸 ， 计 算 机 模拟 可 以 得 到 miRNA 前 体 保守 的 二 级 
结构 ， 并 且 成 熟 序列 应 位 于 发 夹 结构 荃 区 的 5' 或 
3' 侧 。 通 过 序列 的 第 选 ， 最 终 确定 miR-34 基因 的 
同 源 序 列 。 
1.4 同 源 性 比 对 

采用 Clustal W 程序 ( Thompson et al, 1994 ) 
对 miR-34 基因 的 所 有 同 源 序 列 进行 多 序列 比 对 
C multiple sequence alignment, MSA )。 
1.5 构建 系统 发 育 树 

最 后 , 用 MECA(3.1 版 本 ) 软件 对 搜寻 到 的 
miR-34 基因 及 其 同 源 序 列 进行 多 序列 比 对 ， 并 做 
出 相应 的 系统 进化 树 。 


2 RAT 


2.1 miR-34 基因 家 族 新 成 员 的 鉴定 及 特征 分 析 

通过 同 源 性 搜索 的 方法 ,分 别 在 33 个 不 同 的 
动物 物种 中 ， 找 到 了 54 条 Mir-34 基因 的 同 源 序列 
(Tab. 1)， 其 中 18 条 为 新 发 现 的 序列 (和 斜体),， 它 
们 都 具有 典型 的 茎 环 状 二 级 结构 (Fig. 1 )。 本 文 
中 一 致 用 miR-# 代表 miRNA，mir-#( RHE) 代表 
miRNA 前 体 基 因 。miR-34 基因 及 其 同系 物 广 泛 存 
在 于 节肢 动物 ， 线 虫 纲 动物 以 及 许多 哺乳 动物 中 ， 
保守 性 很 高 。miR-34 家 族 中 大 部 分 成 员 (70% ) 
的 基因 位 置 已 知 ， 其 中 84% 都 位 于 基因 间隔 
(intergenic region, IGR )， 少 数位 于 蛋白 编码 基因 的 
内 含 子 区 和 3'UTR 上 。 狗 mir-34a 基因 位 于 其 $ 号 
染色 体 Loceos460 基因 的 内 含 子 区 ， 原 鸡 mir-34a 
基因 位 于 ENSGALT00000035086/87 基因 的 内 含 子 
区 。 此 外 ， 人 和 黑猩猩 的 mir-34b 和 mir-34c 基 
分 别 位 于 同 源 基因 的 内 含 子 区 和 3'UTR Eo 

序列 分 析 发 现在 人 、 黑 猩猩 、 牛 、 狗 、 小 鼠 、 
大 鼠 、 斑 马 鱼 以 及 原 鸡 8 个 物种 中 ，rmir-348 Æ 
与 mir-34c 基因 均 紧 密 相连 ， 位 于 同一 染色 体 上 。 
人 和 黑猩猩 的 mir-34b 和 mir-34c 基因 分 别 位 于 局 









































































































































































































































































































































源 基因 的 内 含 子 区 和 3 UTR E, 让 其 他 物种 中 
mir-34b 基因 和 mir-34c 基因 都 位 于 同一 基因 间隔 
KA (Fig. 2)。 这 一 组 织 形式 的 特征 暗示 了 这 两 











个 基因 ( mir-348 与 mir-34c ) 很 可 能 是 在 进化 过 程 
中 由 串联 重复 产生 的 《Tanzer & Stadler, 2004 )o 
2.2 miR-34 基因 家 族 同 源 性 分 析 
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X1 所 有 已 测序 的 动物 物种 中 的 miR-34 基因 及 其 同 源 物 

Tab. 1 miR-34 and its orthologue found in sequenced metazoan 
min E 物种 Species 基因 位 置 Cone location RACE d 
miR name Gene organization +/ - chanin 
aga-miR-34 A. * 冈比亚 按 蚁 Anopheles gambiae ch2R: 28232717-28232737 基因 间隔 区 - 
age-miR-342€9 BOBO Areles geoffroyi 未 知 未 知 
ame-miR-34 A. 蜜蜂 Apis mellifera group5: 327549-327569 AE 
bmo-miR-34 他 家 蝉 Bombyx mori BAAB01147222: 1416-1513 基因 间隔 区 
bta-miR-34a & * Æ Bos taurus chr16: 30629167-30629189 基因 间隔 区 
bta-miR-34b 他 六 Æ B. taurus Un. 7588: 19678-19699 基因 间隔 区 - 
bta-miR-34cA& * Æ B. taurus Un. 7588: 18978-18999 基因 间隔 区 - 
cbr-miR-344 大 线虫 Caenorhabditis briggsae chrUn: 55197686-55197707 基因 间隔 区 + 
cel-miR-344& * 线虫 C .elegans chrx: 2969803-2969824 基因 间隔 区 - 
cfa-miR-34a & * 狗 Canis familiaris chr5: 65484449—65484471 LOC608460 内 会 子 区 - 
cfa-miR-34b & x 狗 C . familiaris chr5: 24566992 -24567014 基因 间隔 区 - 
cfa-miR-34c & x 狗 C . familiaris chr5: 24567022-24567044 基因 间隔 区 - 
dre-miR-344 * 斑马 鱼 Danio rerio ch23: 24608106-24608127 基因 间隔 区 十 
dre-miR-34b & * SES D. rerio ch5: 64601186-64601208 基因 间隔 区 - 
dre-miR-34cA& x 斑马 鱼 D. rerio ch5: 64600946-64600968 基因 间隔 区 
dan-miR-34 * 嗜 凤梨 果 蝇 Drosophila ananassae scaffold _13340: 6488582-6488602 未 知 + 
der-miR-34 * FHA D. erecta scaffold _ 4770: 15677094-15677114 未 知 
dgr-miR-34 * FHA D. grimshawi scaffold 24940: 2264380-2264400 未 知 十 
dme-miR-34 全 大 FHA D. melanogaster chr3R: 5926674-5926695 基因 间隔 区 + 
dpe-miR-34 x FHA D . persimilis super- 19: 725072-725092 未 知 
dps-miR-34 全 大 FHA D . pseudoobscura chr2: 4980658-4980679 基因 间隔 区 
dse-miR-34 * FHA D. sechellia super-0: 15986909-15986929 未 知 - 
dsi-miR-34 * WRA D. simulans ch3R: 15449447-15449467 未 知 - 
dvi-miR-34 * URB D. virilis scaffold 12855: 2681947-2681967 未 知 E 
dya-miR-34 * FHA D. yakuba ch3R: 9974486-9974506 未 知 * 
ete-miR-340€ 无 尾 猎 Echinops telfairi scaffold -39512: 1412-1434 基因 间隔 区 十 
gga-miR-34a4 x 原 鸡 Callus gallus ch21: 3118953-3119075 ENSGALT00000085086/87 内 合子 | - 
gga- miR-34b A x 原 鸡 C . gallus ch24: 5217102-5217124 基因 间隔 区 
gea-miR-34c 他 大 原 鸡 C . gallus ch24: 5217839-5217861 基因 间隔 区 + 
geo-miR-34a@ 大 猩猩 Gorilla gorilla 未 知 未 知 未 知 
hsa-miR-34a 他 * 人 Homo sapiens chl: 9134380-9134402 基因 间隔 区 - 
hsa-miR-34b A * Á H. sapiens ch11: 110888885-110888907 L0C728196 内 会 子 区 十 
hsa-miR-34c 人 入 * 人 H. sapiens chili: 110889386- 110889408 3'UTR 区 * 
ptr-miR-34446 黑猩猩 Pan troglodytes ch1: 9151501-9151522 基因 间隔 区 - 
pir-miR-34b 4. 黑猩猩 P. troglodytes chili: 6998680-6998702 LOC738013 WATE 十 
pitr-miR-34c 46 黑猩猩 P. troglodytes chii: 6999193-6999215 3'UTR [X * 
Ila-miR-3449 免 猴 Lagothrix lagotricha 未 知 未 知 
imdo-miR-34a 他 南美 负 鼠 Monodelphis domestica. ch4: 428562614-428562724 区 十 
mml-miR-34a A 猕猴 Macaca mulatta scaffold91438: 18223-18244 区 * 
mne-miR-3428 豚 尾 猴 M . nemestrina 未 知 未 知 
ppa-miR-34a@ 无 黑猩猩 Pan paniscus 未 知 未 知 
ppy-miR-34a@ 猩猩 Pongo pygmaeus 未 知 未 知 
mmu-miR-34a 他 类 INSR Mus musculus ch4: 148912273-148912295 区 十 
mmu-miR-34b4& 大 小 鼠 M . musculus ch9: 50855841—50855863 区 - 
mmu-miR-34c4& 大 小 鼠 M . musculus ch9: 50855306-50855328 区 - 
rno-miR-34a4 * KFR Rattus norvegicus ch5: 167187916-167187938 区 十 
rno-miR-34b A * KFR R . norvegicus ch8: 54422619-54422641 K - 
ITno-miR-34c 他 六 KFR R . norvegicus ch8: 54422094-54422116 K - 
sla-miR-3448 红 腹 狂 Saguinus labiatus 未 知 未 知 
xtr-miR-34a 大 非洲 爪 蟾 Xenopus tropicalis scaffold 207: 56399-56421 十 
xtr-miR-34b-14& * 非洲 爪 蟾 X. tropicalis scaffold 1127: 6080-6102 区 = 
xtr-miR-34b-2& * 非洲 爪 蟾 X. tropicalis scaffold 1127: 13647-13669 区 + 
xtr-miR-34b-34& * 非洲 爪 蟾 X. tropicalis scaffold 39: 3202291-3202313 区 - 
xtr-miR-34b-44& * FEWJTUE X. tropicalis scaffold 39: 3208151-3208173 区 * 








全 表示 使 用 NCBI 数据 库 搜寻 获得 ，x* 表示 使 用 UCSC 数据 库 ， 鲁 表示 使 用 ENSEMBL 数据 库 。 黑 斜体 表示 新 发 现 的 miR-34 同 源 序列 。 
Triangles denote data from NCBI. Asterisks denote data from UCSC. Rounds denote data from ENSEMBL. New orthologues of miR-34 are in black italics. 
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图 1 新 Mir-34 基因 家 族 成 员 的 二 级 结构 预测 
Fig. 1 Predicted hairpin secondary structures of identified novel miRNAs using RNAviz software 
成 熟 microRNA 序列 用 下 划 线 表示 (Mature miRNA is underlined )。 
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2. 八 个 物种 中 mir-34b FA mir-34c 基因 位 置 示意 
Fig. 2 Characterization of genomic organization of mir-34b and mir-34c in the eight animal species 
方 框 表示 外 显 子 ， 实 线 箭头 表示 转录 方向 ， 空 心 箭头 分 别 表示 mir-34b. mir-34c 基因 及 其 上 下 游 基因 ， 虚 线 部 分 表示 未 知 序列 。 


Exons are represented by boxes. mir-34b , mir-34c and neighbor gene sequences are represented by arrow. The cartoon is not drawn to scale. 
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miR-34 家 族 成 员 的 成 熟 序列 同 源 性 很 高 ， 约 “分 表示 了 同 源 性 较 高 的 碱 基 。 有 人 少数 位 点 的 碱 基 呈 
为 6895 (Tab. 2)。 序 列 长 度 是 相近 的 ，22 一 23 m, — 现 出 类 似 于 单 核 苷 酸 多 态 性 (SNP) 的 现象 ( Tong 
保守 的 碱 基数 为 19 个 。miRNA 的 5’ 端的 2 一 8 个 et al, 2006). 



































核 背 酸 对 于 miRNA 与 靶 序 列 3' UTR 区 的 配对 非常 A2 MIR. 和 4 基因 家 族 各 成 员 成 熟 序列 比较 
重要 ， 而 被 称 为 种 子 序列 ( Doench & Sharp, Tab. 2 Multiple sequence alignment of the mature 
2004)。 这 段 序列 在 同 源 的 miRNA 中 通常 是 保守 sequence of miR-34 gene family 

的 ， 比 对 的 结果 正和 证 明了 这 一 点 。 从 差异 和 碱 基 的 变 MTR 名 称 成 就 序列 WE Cu) 
化 特征 来 看 ，miR-34 基因 及 其 同系 物 在 进化 过 程 MIR name Mahire sequence Base mimber 
中 很 可 能 发 生 了 碱 基 的 缺失 。 例 如 miR-34a 很 可 能 milt-34 a 2 

在 11 位 缺失 了 一 个 碱 基 。 此 外 ，10 一 11 位 碱 基 在 rag 

四 个 家 族 成 员 中 保守 性 相对 不 高 ， 这 可 能 于 两 i eon EA 3H í 
个 碱 基 错 配 的 结构 更 有 利于 miRNA SRRA M MERI 





e 


mili-34e Aggeaguguaguuagenganuge 23 
配对 (Doench & Sharp, 2004 )。 — — 


多 序列 比 对 分 析 显示 miR-34 基因 家 族 成 员 前 保守 大 用 了 影 标注 大 的 缺失 用 短线 () 表示 。 
E y m Highly conserved bases are shadowed. Hyphen denotes base deletion. 
体 基 因 同 源 性 约 为 38.89% (Fig. 3), AFRESH 























cfa-34b 

hsa-34c 

ptr-34c 

bta-34c 

mmu-34c 

rno-3ác 

9gga-34c 

dre-34c 

xtr-34b-1 -rr 一 TGTTGGGTTTTCAGGCAGTGTAGTTAGCTGATTGTGTTAAC 
xtr-34b-3 --TGTTGGGTTTTCAGGCAGTGTAGTTAGCTGATTGTGTTAAC 
xtr-34b-2 TTCAGGCAGTGTAGTTAGCTGATTGTGTTA-T 
xtr-34b-4 TTCAGGCAGTGTAGTTAGCTGATTGTGTTA-T 
dre-34b GGGGTTGGTCTGTAGGCAGTGTTGTTAGCTGATTGTTT---C 
bta-Ma —— 0 5e GGCCAGCTGTGAGTGTTTCTTTGGCAGTGTC-TTAGCTGGTTGTTGTGAG 
cfa-34a TCATCGTCAGGGCCAGCTGTGAGTGTTTCTTTGGCAGTGTC-TTAGCTGGTTGTTGTGAG 
hsa-3da —— 4-74 GGCCAGCTGTGAGTGTTTCTTTGGCAGTGTC-TTAGCTGGTTGTTGTGAG 
ptto34a —— — E GGCCAGCTGTGAGTGTTTCTTTGGCAGTGTC- TTAGCTGGTTGTTGTOAG 
gga-34a — — — --———7-- GCCAGCTGTGAGTGTTTCTTTGGCAGTGTC-TTAGCTGGTTGTTGTGAG 
mmu-34a --CCAGCTGTGAGTAATTCTTTGGCAGTGTC-TTAGCTGGTTGTTGTGAG 
rüo-34a RH CCGGCTGTGAGTAATTCTTTGGCAGTGTC- TTAGCTGGTTGTTGTGAG 
ytret — emm mem CTGTGAGTGTTTCTTITGGCAGTGTC-TTAGCTGGTTGTTGTGGC 
dre-34 " --CTGCTGTGAGTGGTTCTCTGGCAGTGTC-TTAGCTGGTTGTTGTGTG 
hsa-ddb — — 0 emn GTGCTCGGTTTGTAGGCAGTGTCAT TAGCTGATTGTACTGTG 
ptr-3Ab 0 esee asas GTGCTCGGTTTGTAGGCAGTGTCATTAGCTGATTGTACTGTG 
mmu-34b bris -GTGCTCGGTTTGTAGGCAGTGTAATTAGCTGATTGTAGTGCG 
rno-34b bm -GTGCTCGGTTTGTAGGCAGTGTAATTAGCTGATTGTAGTGCG 
bta-34b ORI TTE edi GTGCTCGGTTTGTAGGCAGTGTAATTAGCTGATTGTACTCTC 
cfa-34c - CGGGCGCCCGGTGCTCGGTTTGTAGGCAGTGTAATTAGCTGATTGTCCTCTG 
gga-34b Ar GTGCTTGGTTTGCAGGCAGTGTAGTTAGCTGATTGTACCCAG 
cbr-34 s --AAGCACTCATGGTCGTGA-GGCAGTGTGGTTAGCTGGTTGCATACAC 
cei CGGACA-ATGCTCGAGA-GGCAGTGTGGTTAGCTGGTTGCATATTT 
dme-34 AATT- -GGCTATGCGCTTTGGCAGTGTGGTTAGCTGGTTGTGTAGCC 
dps-34 --7AATT--GGCTATGCGCTTTGGCAGTGTGGT TAGCTGGTTGTGTAGCC 


bmocd4 — 0 e AGAATCAGGGTAGACCGCGT TGGCAGTGTGGTTAGCTGGTTGTGTATGG 


rua tert ex na 
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cta-34b AATAGTAC------- CAATCACTAACCACACGGCCAGGTAAAAAGATTTGGGAATCAT- - 
hsa-34c AATAGTAC CTCAATCACTAACCACACGGCCAGGTAAAAAGATT- - ~ -- 中 
pir-34c AATAGTAC------- CAATCACTAACCACACGGCCAGGTAAAAAGATT- - ~ 
bia-3ác AATAATAC-------CAATCACTAACCACACGGCCAGGTAAARAGATT---7-- 
emu-3éc AATAGTAC "TCAATCACTAACCACACAGCCAGGTAAAAAGACT----------- 
rio-3ác AATAGTAC-------CAATCACTAACCACACAGCCAGGTAAAAAGACT- -momma =+ = 
gga-3ác ACCAGGAC- --7---CAATCACTA&CCACACAGCCAGGTAAAAAG-- -- È 
dre-3ic ATCCATAAA----- GTAATCACTAACCTCACTACCAGGTGAAGGCTAGTA^-------- 
xtr-34be- d ATAAGACTT----- GCAATCACTAGCTAAACTACCAGCAAAACTAAACA- 7 --—--- 
xir-34h-3 ATAAGACTT- --- -GCAATCACTAGCTAAACTACCAGCAAAACTAAACA mem 
xtrzd4b-2 ATCAAATTT-----GCAATCACTAGCTAAACTACCATAAAA- eee 
xir-34b-4 ATCAAATIT----- GCAATCACTAGCTAAACTACCATAAAA -- - 
dee-34b ATATGAACT-- --— ATAATCACTAACCATACTGCCAACACAACAACCTACA -- - 
btà-343 TARTAATGCAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACGTTGT -GGGC 
cía-34a TAATAGTGAAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACGTTGTTGGGC 
hsa-34a CAATAGT-AAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACGTTGTGGGGC 
ptr-34a CAATAGT-AAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACGTTGTGGGGC 
gga-34a CAATAGTTAAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTACACATTGTTGGGC 
mmua-i4a TATTAGCTAAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACATTGT---- - 
ino-34a TYATTAGCTAAGGAAGCAATCAGCAAGTATACTGCCCTAGAAGTGCTGCACGTTGT- 
xir-34a ACGTTATAGAAGTAGCAATCAGCAAATATACTGCCCTAGAAGTTCTGCACATT--- ~ = 
dre-34 GAGTGAG-AACGAAGCAATCAGCAAGTATACTGCCGCAGAAACTOGTCACCTT------- 
hsa-34b GTGGTTA--------CAATCACTAACTCCACTGCCATCAAAACAAGGCAC - - - 3 
ptr-3b GTGGTTA--------CAATCACTAACTCCACTGCCATCAAAACAAGGCAC -~ -~ -~ 
mmu- 34b GTGCTGA- ------- CAATCACTAACTCCACTGCCATCAAAACAAGGCAC- =~- =w= = = 
rno-34b STGCTCA-- - CAATCACTAACTCCACTGCCATCAAAACAAGCCAC- xe 
bta-34b ATGCTTA------- CARTCACTAGTTCCACTGCCATCAAAACAAGGCAC ~ 
tta-34c CTGCTTA--…---~---C------ me em A m mmm m 
gga-34b CGCCCCA- - - -CCAATCACTAAATTCACTGCCATCAAAACAACGCAC - -- em 
cbr-34 AGG-- -TIGAC- -AACGGCTACCTTCACTGCCACCCCGAACATG-TAGTCCTC------- 
cel-34 CC---- TTGAC- - ANCGGCTACCTTCACTGCCACCCCGAACATG-TCGTCCATCTTTGAA 
dme-34 AAT-TATIGCC- -GTTGACAA- - TTCACAGCCACTATCTTCAC- - TGCCGCCGCGACAAG 
dps-34 ARAATATTGCC--TTTGACCA -~ TTCACAGCCACTATCTTCAC-- TGCCGCCGCOACAAG 
bmo-34 AAÀA- ---TGAC- - AACAGCCA - - -CTAACGACACTGCTCCTGCG- TGCACCCTAAATCA- 
图 3 miR-34 基因 家 族 前 体 的 多 序列 比 对 
Fig. 3 Multiple sequence alignment of the precursor sequence of miR-34 gene family 
星 号 表示 同 源 性 较 高 的 碱 基 (Highly conserved bases are in asterisks )。 
2.3 miR-34 系统 发 育 分 析 鸟 类 ( 原 鸡 )， 两 栖 岗 动物 GEMI) 中 都 保守 ， 
搜寻 到 的 所 有 miR-34 同 源 序列 分 别 分 布 在 节 ”这 一 分 支 中 只 有 一 个 例外 是 dre-mir-34。 正 如 前 面 
肢 动 物 门 、 线 虫 岗 、 鱼 纲 、 两 栖 岗 、 鸟 岗 和 哺乳 动 基因 位 置 分 析 结 果 那 样 ，mir-346 基因 与 mir-34c 
物 中 。 选 择 这 些 纲目 中 系统 发 育 研 究 的 模式 物种 用 ”基因 亲缘 关系 很 近 ， 并 且 它 们 与 mir-34a 基因 是 平 
































MEGA 3.1 软件 构建 系统 进 
Sempere et al, 2006) (Fig. 4). 总 的 来 看 ， 进 化 树 TEJUB EZ TP. miR-34 基因 只 有 一 个 拷贝 
大 致 可 分 为 三 支 ; mir-346 和 mir-34c 位 于 第 一 分 (mir-34 )， 而 在 次 椎 动物 中 miR-34 基因 有 3 个 拷贝 
三 条 分 支 中 是 mir-34。 《mir-34a，mir-34b，mir-34c ), H miR-34 基因 家 
的 分 支 和 距离 上 来 看 ，mir-34 基因 的 分 。 族 的 3 个 成 员 稳 定 地 存在 于 从 鱼 类 到 哺乳 动物 中 。 








从 进化 树 
支出 现在 











可 能 是 miR-34 基因 家 族 中 
o mir-34a 基因 在 所 有 被 建树 研究 的 哺 。” 因 作 为 该 家 族 最 古老 的 基因 形式 仅 存 在 于 节肢 动物 


即 祖先 基 


中 ; 其 次 是 mir-34a; 第 





化 树 ( Jing et al. 2004; ”行进 化 的 。 
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进化 早期 并 且 一 直 延 续 到 现在 ， 因 而 它 很 基于 以 上 的 鉴定 和 分 析 结 果 ， 可 推测 出 miR-34 基 


最 早出 现 的 基因 形式 ， ” 因 家 族 可 能 的 系统 进化 历史 ( Fig. S). mir-34 Æ 






































她 动物 ( 人、 黑猩猩、 小 鼠 、 大 鼠 、 牛 、 狗 ) 以 及 ” 和 线虫 岗 动物 等 无 峭 椎 动物 中 
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。 在 由 无 洗 椎 向 将 椎 
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Abr-mir-34b-4 
dre-mir-34; 
dre-mir-34c 
mozmir-3ec 
eta-mir-3Ab 
hsa-mir-34e 
plr-mir-34e 
bta -mir-34e 
p ytr-mir-34a 
dre-mir-34 
hisa-inir-34a 
pl;-mir-34a 
mir-34a 
efa-mir-34a 
mmi-inir-34a 
rno-mir-34a 
bla-mir-34n 
bma-mir-34 
p—— eel-mir-34 
L— ebr-mir-34 
aal p— dme-mir-34 
dps-mir-34. 

















图 4 MEGA 软件 NJ 法 构建 miR-34 基因 家 族 系统 进化 树 
Fig. 4 Phylogenetic tree of the miR-34 gene family constructed using 
MEGA version 3.1 based on the neighbor-joining method 

缩写 如 下 ( Abbreviations are indicated as follows ): cel (线虫 ， 
Caenorhabditis elegans ); cbr ( R "B, C.briggsae: dme ( È 88, 
Drosophila melanogaster ); dps ( RH, D. pseudoobscura ); bmo ( 家 
3k, Bombyx mori ); dre ( HEH £&, Danio rerio ); hsa ( Á, Homo 
sapiens ); ptr (黑猩猩 ，Pan troglodytes ); mmu (小 鼠 ，Mas muscu- 
lus); mo (KẸ, Rattus norvegicus ); cfa (JJ, Canis familiaris ); bta 
(^F, Bos taurus ); xr. ( EWIT, Xenopus tropicalis ); gga ( 原 鸡 ， 
Gallus gallus ) 














物 进 化 的 过 程 中 新 出 现 了 紧密 相连 的 mir-348 和 
-34c ， 它 们 很 可 能 是 由 mir-34 基因 经 过 一 次 局 
重复 ， 随 后 又 发 生 了 一 次 串联 重复 形成 的 。 在 进 
到 较 高 等 的 将 椎 动物 ( 两栖 岗 ) 过 程 中 ，mir-34 
发 生 碱 基 变 异 后 以 mir-34a 基因 形式 存在 。 此 
， 两 栖 岗 动物 中 mir-34c 的 缺失 可 能 是 由 于 基因 
序列 拼接 不 完全 的 缘故 。 
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图 5 miR-34 基因 家 族 可 能 的 系统 进化 历史 








Fig. 5 A plausib 





miR-34 gene family 


3 讨论 


e scenario for the evolution of the 


MicroRNA 作为 生物 体 正常 表达 的 内 源 非 编码 


RNA 分 子 ， 具有 高 度 的 保 久 


(2004) 在 对 miR-1 
现 ， 该 基因 簇 进化 























FHE Tanzer & Stadler 











进化 过 程 伴随 着 个 别 基 


因 禾 的 复制 。 此 尹 


进化 研究 结果 也 得 出 了 相似 的 结论 ， 基 
复制 的 结果 (Elemento et al, 


成 通常 被 认为 是 基 
































7 基因 簇 的 分 子 进化 研究 时 发 
可 能 与 消 椎 动物 早期 进化 有 关 ， 
的 复制 和 缺失 以 及 整个 基 

， 水 稻 miR-395 基因 家 族 的 分 子 
家 族 的 形 




















2002 )。 目 前， 在 已 测序 的 33 fiU TRIER 














了 354 个 miR-34 基 
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中 miR-34 基 
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家 族 类 化 
物 的 进化 过 程 中 也 发 
局 部 重复 (Fig. 5 )。 在 漫 
有 成 的 miR-34 基 i 


物 中 发 现 


。 表 明 miR-34 是 高 度 保守 的 ， 
Ph。 在 无 洗 椎 动物 利 
家 族 成 员 个 数 并 不 相同 ， 表 明 与 
HI miR-395 基 

3S EZ! 
E 
长 的 进化 过 程 中 , 3 RAS 


TEE] 


， miR-34 
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需要 更 多 的 











mir-34 基因 来 
的 行使 其 调控 功能 


兰 椎 动物 的 不 同 的 组 织 中 特异 性 表达 。 


同属 非 编码 小 RNA 行列 的 还 有 snoRNA 等 。Ze- 
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; 或 者 这 些 mir-34 基 
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mann et al (2006) 在 研究 线虫 saoRNA 


snoRNA 基因 的 进 
plication ) TIGE 
成 的 。Luo & Li ( 








snoRNA 时 发 现 ，snoRNA 还 可 


制 而 复制 。 此 外 ，s 


化 主要 是 通过 反 式 重 








进化 时 指出 ， 


复 ( trans- 
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& ( cis-duplication ) 的 策略 来 完 





2006) 在 研究 人 








的 box H/ACA 
Jag RNA 介 导 的 机 








noRNA 与 其 





rRNA 靶 序 列 存 在 共 
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进化 的 现象 。 非 编码 小 RNA 基因 的 进化 有 共通 之 
处 ，miRNA 的 进化 也 主要 是 通过 重复 及 随后 的 序列 








变异 来 完成 的 ( Pasquinelli & Ruvkun, 2002; Grun et 
al, 2005; Houbaviy et al, 2005). 由 于 miRNA 行使 
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